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基于 数据 对 齐 万 法 的 错误 相关 脑 电 识别 
孙 劲 松 , 何 峰 , 王 昊 , 重 佳 圆 , 许 敏 鹏 ， 
(1. 天 津 大 学 医学 工程 与 转换 医学 研究 院 ” 天津 300072) 


摘 要 : 缺乏 训练 本 导致 的 脑 电 识别 正确 率 不 足 是 阻碍 错误 相关 电位 《ErrP〉 脑 机 接口 实用 化 的 重要 难题 ,为 提升 有 限 训练 样 
本 条 件 下 的 ErrP 识 别 效果 ,本 研究 提出 一 种 基于 数据 对 齐 策 略 的 迁移 判别 子 空间 分 析 (TDSA〉 算 法 ,该 算法 提取 源 受 试 者 与 目 
标 受 试 者 脑 电 样本 中 体现 类 间 差 异 信息 的 共有 判别 子 空间 ,通过 子 空间 中 的 时 域 对 齐 策 略 ,成 功 强化 了 受 试 者 之 间 的 共有 特征 。 
研究 使 用 2 个 公开 数据 集 ,对 比 6 种 不 同 数据 对 齐 迁移 学 习 策 略 ,结果 表明 ,小 样本 条 件 下 TDSA 算 法 在 数据 集 1 中 的 平衡 正确 率 相 
较 次 优 的 基于 欧式 对 齐 方法 提高 6.07%, 相 较 不 使 用 迁移 学 习 方法 提高 7.88%.TDSA 算 法 仅 需 60 一 100 个 目标 受 试 者 数据 样本 
训练 , 即 可 接近 传统 分 类 策略 使 用 210 一 350 个 样本 进行 训练 的 分 类 水 平 ,为 实现 ErrP 数 据 对 齐 提供 了 新 思路 。 
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Data Alignment Approach for Error-related EEG Recognition 


Sun Jinsong!, He Feng', Wang Hao!, Meng Jiayuan', Xu Minpeng! 


(1.Academy of Medical Engineering and Translational Medicine, Tianjin University, Tianjin 300072, China) 


Abstract: The limited training samples pose a significant obstacle to the practical application of brain-computer interface based on error-related potentials 
(ErrPs), affecting their recognition accuracy. To enhance ErrP recognition under such constraints, we propose a transfer discriminant subspace analysis (TDSA) 
algorithm that leverages a data alignment strategy. This algorithm extracts a shared discriminant subspace from electroencephalogram samples of both source and 
target subjects, capturing inter-class differences. By applying temporal alignment within this subspace, it effectively reinforces common features across subjects. 
We evaluate six different data alignment transfer learning strategies using two publicly available datasets. The results demonstrate that the TDSA algorithm 
achieves a 6.07% improvement in balanced accuracy for dataset 1 compared to the suboptimal Euclidean alignment method and a 7.88% improvement over 
non-transfer learning methods. Remarkably, with only 60~100 target subject data samples for training, the TDSA algorithm approaches the classification 


performance of traditional strategies that require 210~350 samples. This provides a new perspective for facilitating the data alignment of ErrPs. 


Keywords: transfer learning; data alignment; brain-computer interfaces; error-related potentials; electroencephalogram 


051 5 类 反馈 强化 学 习 ， 以 自然 、 高 效 的 方式 获取 反馈 标 
脑 机 接口 〈brain-computer interface, BCI) 是 一 种 签 ， 解 决 数据 标注 成 本 高 等 问题 。 

Vie thy He tOo g EL ah R 

不 依赖 外 周 神经 系统 和 肌肉 ， 直 接 建立 大 脑 与 外 部 设 


各 之 间 连 接 的 通信 系统 趾 。 当 人 意识 到 错误 事件 发 生 及 各 和 生理 伪 影 和 噪声 的 影响 ErP HERI pE 


时 ， 其 大 脑 会 产生 名 为 错误 相关 电位 〈errorrelated 。“ 信 品 比 极 低 。BnP-BCI 为 提高 解码 效果 ， 需 要 大 量 样 
potentials，ErrPs》 的 特征 信号 。 近 年 来 ， 基 于 ErrP ”本 校准 分 类 算法 ， 但 采集 BnP 样 本 低 效 而 耗 时 。 以 上 


的 BCI (ErrP based BCI, ErrP-BCI) 被 引入 强化 学 习 。 ” 难题 极 大 程度 上 限制 了 ErrP-BCI 系 统 的 实用 化 。 


研究 2 使 用 受 试 者 观察 到 人 工 智能 体 做 出 错误 行 迁移 学 习 可 将 以 往 任务 中 学 到 的 知识 和 经 验 用 于 
为 时 产生 的 ErrP 信 号 设计 强化 学 习 的 反馈 ， 以 实现 当前 任务 器。 基于 数据 对 齐 的 迁移 学 习 方 法 属于 特征 变 


智能 体 与 人 类 价值 和 期 望 对 齐 ; 该 策略 使 机 器 和 的。 PL, ITE TEER SL SIRE, 
行为 随时 间 逐 渐 贴 含 人 关 意 图 ， 在 导航 等 场景 中 显 “， 减 小 已 有 源 域 受 试 者 与 未 知 目标 域 受 试 者 之 间 的 数据 


ME 


著 减 小 了 用 户 的 任务 负荷 。 同 类 型 技术 有 望 引 入 人 分 布 差异 , 降低 现 有 分 类 任务 收集 训练 数据 的 工作 量 中 I 
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由 于 脑 电 图 (electroencephalogram，EEG) 数据 
信 噪 比 低 的 特性 ,传统 联合 分 布 自 适应 四 、 迁 移 成 分 分 
析 钙 等 方法 直接 用 于 EEG 数 据 效果 有 限 20184, 
Rodrigues 等 人 00 提 出 黎 曼 对 齐 (Riemannian alignment 
，RA) ， 该 方法 以 对 称 正定 矩阵 (symmetric positive 
definite, SPD) 流 形 上 的 黎 曼 距离 为 度量 ， 以 数据 的 
黎 曼 中 心 为 基准 对 齐 受 试 者 数据 。 由 于 黎 曼 几何 框架 
k 有 同 余 不 变性 、 仿 射 不 变性 等 优良 特质 ，RA 算 法 在 
运动 想象 (motor imagery，MI) 数据 迁移 任务 中 表现 
出 色 。2019 年 ，Rodrigues 等 人 10 进一步 提出 歼 曼 普 
分 析 (Riemannian Procrustes analysis, RPA) 算法 ,该 
算法 将 正 交 强 迫 一 致 问 题 分 析 框 架 引 入 黎 曼 流 形 ， 通 
过 中 心 化 、 拉 伸 、 旋 转 三 种 变换 实现 数据 对 齐 。 由 于 
考虑 了 数据 条 件 分 布 的 差异 ，RPA 算 法 是 目前 MI 数据 
对 齐 效果 最 佳 的 算法 之 一 。 以 上 两 种 算法 均 可 用 于 事 
件 相 关 电 位 (event-related potentials, ERPs) 数据 迁移 
。 近 年 来 ， 何 赫 等 人 [9 提出 欧式 对 齐 〈Euclidean 
alignment，EA) 算法 ， 该 算法 在 欧式 空间 中 将 不 同 受 
试 者 的 样本 协 方差 矩阵 对 齐 到 单位 阵 ， 以 实现 数据 边 
缘分 布 对 齐 。EA 在 多 个 ERP 与 MI 数据 集中 表现 优异 ， 
相 较 RA 方法 ，EA 算 法 计算 时 间 更 低 且 可 用 于 无 监督 
ERP 数 据 迁 移 任务 。 

ErrP 作 为 一 种 ERP 数 据 , 其 类 别 间 时 域 波 形 差异 是 
分 类 的 主要 依据 。 然 而 现 有 EEG 数 据 对 齐 算法 均 未 针 
对 其 时 域 特征 锁 时 锁 相 特点 设计 ， 故 难以 实现 ErrP 数 
据 的 充分 迁移 。 为 此 ， 本 文 提出 一 种 迁移 判别 成 分 分 
Nt (transfer discriminative subspace analysis, TDSA ) 
算法 ， 该 算法 计算 受 试 者 之 间 的 共有 判别 成 分 ， 创 新 
性 地 提出 一 种 共有 判别 成 分 对 齐 策 略 ， 达 成 了 提升 现 
有 ErrP 迁 移 学 习 效 果 的 目的 。 
1 基于 数据 对 齐 的 迁移 学 习 方法 

本 节 介 绍 空 间 滤 波 、TDSA 算 法 及 BCI 应 用 中 其 他 
基于 数据 对 齐 方法 的 迁移 学 习 策 略 。 
1.1 空间 滤波 

ErrP-BCI 中 ， 正 确 事件 诱发 受 试 者 的 靶 试 次 响应 
， 错 误 事 件 诱 发 非 靶 试 次 响应 。 设 O. E RY™ 表示 受 
试 者 隶属 类 别 的 第 j 试 次 EEG 响 应 ， 其 中 i={0,.…,C}， 
jE[LN]，nsE[LNs]，ncE[1,Nd]， 分 别 表示 类 别 标签 、 


W E R”* 将 EEG 观 测 值 恢复 为 EEG 源 的 过 程 [31; 


Si 一 WQ; (1) 


特别 指出 ， 此 处 ERP 信 和 号 源 是 数学 意义 上 的 子 空间 ， 
并非 表示 真实 ERP 信 息 源 。 
1.2 迁移 判别 子 空间 分 析 
1.2.1 问题 描述 
设 0,;、0; 与 0 分 别 表示 已 知 标签 的 目标 受 试 
者 EEG 样 本 、 标 签 未 知 的 目标 受 试 者 EEG 样 本 和 第 n 名 
源 受 试 者 的 EEG 样 本 。 第 n 名 源 受 试 者 的 样本 构成 源 
域 数据 5S"， 如 式 (2) 所 示 : 
sS" = lo", iE 01, ;el[l, Nr} (2) 
N? 为 第 n 名 源 受 试 者 类 别 i 的 样本 数量 。 目 标 受 试 者 
已 知 标签 的 样本 记 为 了 1 ， 标 签 未 知 的 样本 记 为 到 ， 如 
A (3) 与 式 (4) 所 示 : 
T, =40,,,1€ 0,1} 7 E[LNi]f (3) 
T, = \0;, j E [LN] (4) 
其 中 Nv 为 标签 未 知 的 样本 数量 。 我 们 的 目标 是 训练 一 
个 分 类 器 ， 该 分 类 器 利用 来 自 $8" FT, 的 可 用 信息 ， 对 
来 自 的 数据 样本 具有 良好 的 分 类 性 能 。 
1.2.2 协 方差 矩阵 对 齐 
现 共 有 天 名 源 受 试 者 ， 假 设 数据 均 已 经 过 中 心 化 
处 理 。 首 先 ， 算 法 分 别 计算 目标 受 试 者 和 第 n 名 源 受 
试 者 单 试 次 协 方差 矩阵 的 算术 平均 值 R 与 R”: 


1 7 
Road 2-2 (5) 


1 
R'= wee QQ; (6) 
Kp, NAN, 分别 表示 目标 受 试 者 和 第 n 名 源 受 试 者 
的 样本 总 数 。 对 目标 受 试 者 样本 和 第 n 名 源 受 试 者 样 
本 做 如 下 变换 : 


X; = RO, (7) 
Xi, = R” Q; (8) 


经 上 述 变换 ， 目 标 受 试 者 的 协 方差 矩阵 均值 和 源 
受 试 者 的 协 方差 矩阵 均值 均 统一 为 单位 阵 了 。 该 对 齐 
方法 由 何 赫 等 人 0 提出 。 
1.2.3 共有 判别 子 空间 求解 

迁移 判别 子 空间 算法 拟 求解 一 个 子 空间 ， 得 到 表 
示 目 标 受 试 者 和 源 受 试 者 各 类 别 数据 之 间 公 共 差 异 信 


试 次 序号 、 数 据 采 样 点 数目 和 EEG 通 道 数目 。 本 文 ! 
类 别 标签 取 冯 {0,1}， 分 别 对 应 非 靶 试 次 与 靶 试 次 ， 记 
类 别 总 数 7=2。 空 间 滤波 则 定义 为 通过 空间 滤波 器 


EH 


息 的 共有 判别 成 分 。 设 Mi 与 MY 分 别 表 示 目 标 受 试 者 
和 第 n 名 源 受 试 者 第 i 类 EEG 数 据 的 算术 平均 值 ，M 
与 M" 分别 表 示 目 标 受 试 者 和 第 n AVA BET 


Xo a 
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类 均值 的 算术 平均 值 。 我 们 拟 寻 找 一 个 空间 滤波 器 

W, E R®™ ,同时 最 大 化 源 受 试 者 n 和 目标 受 试 者 样本 

的 类 间距 离 和 类 内 距离 之 比 ， 最 优化 问题 如 下 : 
tr(W, (S, + Si)W,) 


arg max (WS, SOW) (9) 
其 中 : 
1 r 5 
Se= pÈ MMAM =M) (10) 
1 
Si =72 WM-M NM -M'Y (11) 
1 
S =D gy o ML, M) (12) 
1 ; 
=È gyr Ae MM, I) (13) 
该 最 优化 问题 的 解 可 由 广义 特征 值 分 解 求 得 : 
(S,+S;)W, =(S, +S")W,A (14) 


特征 值 矩阵 4 中 前 大 个 最 大 特征 值 对 应 的 特征 向 量 组 
成 我 们 需要 的 受 试 者 共有 判别 子 空间 到, ， 根 据 经 验 ， 
本 文 实验 中 取 大 = 10 。 

1.2.4 共有 判别 子 成 分 对 齐 

SE FLW, 对 源 受 试 者 的 EEG 数 据 进 行 空间 滤波 得 
到 共有 判别 成 分 s 


si, =W, X} (15) 


使 用 到 ,对 目标 受 试 者 的 EEG 数 据 进 行 空 间 滤 波 得 到 
有 判别 成 分 S: 


SI) = W, Xi; (16) 


目标 受 试 者 第 ; KRA HEIR BO BE, 为 : 
i= 8 (17) 


ERAT FER AB EY RRE P RYO 使 得 第 


仪 表 学 报 


Chinese Journal of Scientific Instrument 


Vol.41 No.xx 


P 的 待 估计 参数 量 大 ， 考 虑 结构 风险 最 小 化 ， 此 处 为 
算法 添加 正则 化 项 | 上 Pp 沾 , 以 缓解 过 拟 合 , 其 中 0 为 正则 
MAR, 根据 经 验 ， 本 文 实验 中 取 0 = 0.1 。 该 问题 属 
于 典型 凸 优化 问题 ， 其 最 优 解 可 由 拉 格 明日 乘 子 法 求 


1-0 
pe ) [5 + rb me (19) 
N’ 
其 中 ， 
(1-0) : 
x = ie 人 20 
N? 2 sis! (20) 
n 1 > n (21) 
mi =—) Si 
ye 


经 矩阵 P 投影 ， 可 将 第 n 名 源 受 试 者 的 判别 子 成 分 对 
齐 到 目标 受 试 者 的 共有 判别 子 成 分 : 
Si) = SSP" (22) 


1.2.5 建立 分 类 模型 
计算 第 n 名 源源 受 试 者 共有 判别 成 分 9", 和 对 齐 
后 的 共有 判别 成 分 5”， 计 算 目 标 受 试 者 的 共有 判别 成 


后 沿 子 空间 与 时 间 维 度 向 量化 7" 得 到 最 终 用 于 训练 
分 类 模型 的 训练 集 T%, : 


T" = uh Sah Bh JE RO (23) 


Ti, = vect (Ti) E RONEN) (24) 
最 终 可 得 共计 天 个 不 同 的 训练 集 ， 其 中 vect(*) 为 向 量 
化 函数 。 我 们 为 每 个 训练 集 T, 训练 一 个 对 应 的 收缩 
线性 判别 分 析 (shrinkage linear discriminant analysis， 
SKLDA) 5 分 类 器 fi. 742i] 个 SKLDA 分 类 器 。 
目标 受 试 者 标签 未 知 的 第 j 个 试 待 测 EEG 样 本 
O; 依次 经 协 方差 矩阵 对 齐 、 共 有 判别 成 分 提取 、 向 量 
化 操作 后 成 为 最 终 测 试 样本 心 : 

t! = vectW," RQ) E RY" (25) 


n 名 源 受 试 者 的 第 i 类 共有 判别 成 分 %% 与 目标 受 试 者 
第 i RAMA BK mm, 对 齐 ， 最 优化 问题 如 下 : : 


x 2 
si, P" -t| + oP 


1-0 
argmin “= y | wi=LC (18) 


由 于 ERP 数 据 的 采样 点 数 N, 通常 较 多 ， 导 致 投影 矩阵 
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第 n 个 分 类 器 对 样本 # REL f(t"), 最 终 目标 被 
第 j 个 试 待 测 EEG 样 本 的 预测 标签 为 : 


1 1 
zieng > FED) (26) 


KH, sien’) 为 符号 函数 ， 大 于 零 的 值 取 1， 小 于 0 的 
值 取 -1。TDSA 算 法 的 整体 架构 如 图 1 所 示 。 
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协 方差 窍 阵 共有 判别 

对 齐 子 成 分 求解 
源 受 试 1 
源 受 试 2 
HRK 
目标 受 试 


共有 判别 
子 成 分 对 齐 


分 类 器 训练 


图 1 迁移 判别 子 空间 分 析 算 法 框架 
Fig.1 The framework of TDSA 


13 基于 数据 对 齐 的 其 他 迁移 学 习 方法 

(1) 基于 黎 曼 对 齐 的 迁移 学 习 方 法 

RA 算 法 对 齐 的 是 单 试 次 EEG 协 方差 矩阵 1, 

， 该 算法 由 在 求 取 一 个 转换 矩阵 下 使 得 EEG 协 方差 

措 阵 荆 的 均值 对 齐 到 单位 阵 。 下 定义 为 EEG 协 方差 

中 阵 的 黎 曼 均值 ， 是 以 下 最 优化 问题 的 最 优 解 : 
argmin > 6’(R,5,) 


(27) 


其 中 ，6(*) 为 歼 曼 距离 度量 。RA 对 单 试 次 协 方差 矩 
阵 样 本 做 如 下 运算 : 


O 


X, = ROS, R” (28) 


EF aA BRR TT EE. RA BESET AR 
曼 几 何 框架 构建 , 对 齐 后 数据 的 特征 识别 也 需 使 用 
于 黎 曼 流 形 作为 距离 度量 的 分 类 方法 , 本 文 使 用 相 
研究 中 常用 的 到 黎 曼 均值 最 小 距离 (minimum 
distance to riemannian mean, MDRM ) 04 算 法 进行 模 
式 识 别 。 
(2) 基于 欧 氏 对 齐 的 迁移 学 习 方 法 

EA 算法 细节 已 在 1.2.1 节 中 介绍 ， 此 处 不 再 次 
述 。 本 研究 受 试 者 数据 经 EA 对 齐 后 ， 使 用 判别 空间 
模式 (discriminative spatial pattern, DSP) 05] 算 法 进 
行 特征 提取 , 使 用 SKLDA 进行 分 类 。Yasemin 等 人 09 
在 多 个 ErrP 数据 集 上 对 ErrP 常用 分 类 流程 做 出 系统 
测试 ，DSP 4 SKLDA 组 合 的 分 类 流程 表现 优异 。 
(3) 基于 协 方差 矩阵 质心 对 齐 的 迁移 学 习 方 


六 Hat 


Tt 


协 方差 矩阵 质心 对 齐 (covariance matrix centroid 
alignment, CA) 作为 流 形 嵌 入 知识 迁移 算法 的 一 部 


分 由 伍 冬 睿 等 人 07 于 2020 年 提出 。 该 算法 则 在 寻找 
个 转换 矩阵 尽 使 得 各 受 试 者 数据 的 边缘 分 布 接近 。 
此 处 ， 尽 定义 为 各 协 方差 矩阵 的 对 数 一 欧 式 均 值 : 


= 1 
R= exp( 六 之 log(2,)) 


CA 对 齐 的 形式 如 式 (28) 所 示 。 单 试 次 EEG 协 方 
差 窍 阵 样本 经 CA 对 齐 后 , 使 用 切 空间 分 类 器 (tang 
ent space classifier, TSclassifier) 04 进 行 后 续 模 式 
识别 。 

(4) 基于 黎 曼 普 氏 分 析 的 迁移 学 习 方 法 

RPA 算 法 是 一 种 半 监 督 数据 对 齐 方法 , 该 算法 在 
多 个 MI 数据 集中 较 常 用 算法 表现 出 显著 性 能 优势 。 
算法 流程 较为 复杂 , SCH Fi WEVA BR, Ab MBCA 
介绍 ,本 文 实验 使 用 原文 作者 所 提供 的 算法 (https://gi 
thub.com/plcrodrigues/RPA) 。 

ERP 信 和 号 信 噪 比 极 低 ， 单 试 次 ERP 中 噪声 能 量 占 
据 主 要 地 位 ， 因 此 单 试 次 协 方差 矩阵 互 | 难以 捕获 
ERP 特 有 的 锁 时 锁 相 特征 。 在 实践 中 , 研究 者 使 用 RA 
、CA、RPA 算 法 执行 迁移 学 习 任 务 时 ， 通 常 构建 扩 
增 试 次 数据 LS 以 计算 样本 协 方差 矩阵 ": 


lo, m: | E RNeNs 


(29) 


> 


arg __ 
ij 


Jep, M EAR E PRAGE RAER F 
均值 。 
2 实验 验证 

本 节 介绍 算法 验证 所 使 用 的 数据 集 
法 、 测 试 流程 、 实 验 设置 和 结果 。 
2.1 实验 数据 集 与 预 处 理 方法 


(30) 


预 处 理 方 
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C1) 数据 集 1 

数据 集 1 为 人 -机 器 人 交互 光标 “Human-robot 
interaction cursor，HRIcursor) 公开 数据 集 ， 共 包含 
11 名 受 试 者 数据 。 试验 要 求 受 试 者 观察 机 器 人 的 动作 
\ 屏 幕 上 的 光标 运动 及 运动 结束 后 屏幕 中 给 出 的 反馈 
; 当 机 器 人 所 示意 的 光标 运动 方向 和 实际 的 光标 运动 
方向 不 一 致 时 ， 屏 幕 给 出 的 反馈 会 诱发 受 试 者 产 4 
ErrP 响 应 。 试 验 具 体 细节 详 见 Ehrlich 等 人 09 的 研究 。 
试验 过 程 中 受 试 者 佩戴 32 导 联 EEG 帽 采集 大 脑 活 动 
数据 ， 其 中 包括 3 个 眼 电 (electrooculogram，EOG) 
电极 ， 电 极 位 置 符合 国际 10-20 电 极 排 布 系统 要 求 ， 
参考 电极 为 左右 乳 突 电极 的 平均 值 。 每 名 受 试 者 有 
500 试 次 EEG 样 本 ， 含 有 ErrP 信 号 的 裔 试 次 占 比 为 31 
~42%. 

(2) 数据 集 2 

数据 集 2 为 人 -机 器 人 机 交互 互 适 应 (Human-rob 
ot interaction co-adaptation，HRIcoadapt) 公开 数据 集 
， 共 包含 16 名 受 试 者 数据 。 试验 要 求 受 试 者 观察 机 器 
人 和 屏幕 呈现 的 反馈 。 试验 中 机 器 人 将 给 出 暗示, 然 
后 注视 前 方位 于 三 个 不 同位 置 的 物品 , 受 试 者 需要 根 
据 机 器 人 的 暗示 猜测 其 将 要 注视 的 物品 ; 当 机 器 人 实 
际 注视 的 物品 与 受 试 者 的 猜测 不 一 致 时 , 屏幕 呈现 的 
有 反馈 将 诱发 受 试 者 产生 ErrP 响 应 。 试验 具体 细节 详 见 
Ehrlich 等 人 [9 的 研究 。 数 据 采 集 方法 与 数据 集 1 一 致 
。 每 名 受 试 者 约 有 300 试 次 EEG 样 本 ， 其 中 含有 ErrP 
言 号 的 鞭 试 次 占 比 为 29~60%。 特 别 指出 ， 只 有 受 试 
者 内 部 ErrP 分 类 平衡 正确 率 高 于 随机 水 平 的 受 试 者 


[tT 


才 有 充足 的 可 供 迁 移 的 有 用 信息 。 故 数据 集 2 中 仅 10 
名 受 试 者 数据 用 于 后 续 试 验 分 析 , 该 做 法 常见 于 相关 
HOM, 


(3) 预 处 理 方法 

数据 预 处 理 时 ， 首 先 丢 弃 3 个 EOG 电 极 ， 数 据 经 
1-10 Hz 带 通 滤波 后 降 采 样 至 128 Hz， 数 据 由 左右 乳 
突 平均 参考 转 为 共 平 均 参 考 。 数 据 集 2 中 数据 以 电脑 
反馈 出 现 的 时 刻 为 0 时 刻 ， 截 取 前 0.2 s 后 0.5 s 的 数据 
， 前 0.2 s 的 数据 用 于 去 基线 ， 后 0.6 s 数 据 用 于 分 类 任 
务 。 考 虑 数据 集 1 实 验 范 式 设 计 差 异 ， 数 据 分 段 步骤 
截取 电脑 反馈 后 0.6 s 的 数据 用 于 分 类 , 不 执行 去 基线 
操作 。 
2.2 算法 测试 流程 与 实验 设置 

(1) 对 比 算法 

实验 测试 的 分 类 流程 共 7 种 ，TDSA 分 类 过 程 已 
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介绍 ， 其 余 6 种 总 结 如 下 : 
1) 受 试 者 内 分 类 (calibration， cali) : 将 目标 
受 试 者 数据 划分 为 已 知 标签 的 目标 域 数据 TT 和 标签 
未 知 的 目标 域 数据 T,， 使 用 工 训练 算 法 ， 使 用 工 测 
试 算法 性 能 , 流程 与 常规 EEG 分 类 一 致 。 该 分 类 流程 
使 用 DSP 算 法 提取 特征 ， 然 后 使 用 SKLDA 执 行 模式 
识别 。 

2) 直接 分 类 (direct, DCT) : 将 目标 受 试 者 数 
据 划分 为 于 和 天 ， 源 受 试 者 数据 不 做 任何 处 理 与 目 
标 受 试 者 训练 集 数 据 组 合成 一 个 更 大 的 训练 集 
WSS", EZARRIAK, te To 测试 


算法 性 能 。 使 用 DSP 算 法 提取 特征 , 然后 使 用 SKLDA 
执行 模式 识别 。 
3) 基于 数据 对 齐 的 迁移 学 习 方法 : 主要 为 1.3 


节 介 绍 的 4 种 分 类 流程 : EA+DSP+SKLDA 、 
RA+MDRM、CA+TSclassifier、RPA+MDRM。 算 法 
测试 时 ， 将 目标 受 试 者 数据 划分 为 和 TT ， 逐 一 将 
源 受 试 者 数据 5S” 与 已 知 标签 的 目标 域 数据 T 对齐 3 
ARIER Tin = ATS} ,为 每 个 训练 集训 练 对 应 的 
分 类 器 ， 共 得 到 天 个 分 类 器 ， 最 终 决 策 方式 与 1.2.5 
节 所 述 方式 相同 。 有 具体 分 类 流程 如 图 2 所 示 。 


训练 集 
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图 2 基于 数据 对 齐 的 迁移 学 习 方 法 分 类 流程 图 
Fig.2 The classification framework of data alignment 
based transfer learning 
(2) 实验 设置 
为 测试 算法 性 能 随 T 中 样本 数量 的 变化 情况 ， 
实验 选择 一 名 受 试 者 为 目标 受 试 者 , 其 余 受 试 者 为 源 
受 试 者 , 并 随机 抽取 占 目标 受 试 者 样本 总 数 不 同 比例 
(10%, 20%, 30%, 40%, 50%, 60%, 70%) 的 数 
据 构成 卫 , 在 剩余 数据 中 随机 抽取 30% 目 标 受 试 者 样 
本 总 数 的 数据 构成 了 ， 算 法 依次 在 不 同 大 小 的 也 上 
进行 迁移 学 习 与 训练 ， 在 ,上 进行 性 能 评估 ;实验 
依次 选择 每 名 受 试 者 作为 目标 受 试 者 , 直到 数据 集中 
所 有 受 试 者 均 当 选 过 目标 受 试 者 后 结束 。 以 上 过 程 重 
日 ， 为 投稿 日 期 ) 


(所 有 资助 必须 提供 项 目 编号 ) 


复 20 轮 ， 取 20 轮 评估 结果 的 平均 值 作为 最 终结 果 。 


(3) 算法 性 能 指标 


ErrP 识 别 属于 非 平衡 样本 的 分 类 问题 , 考虑 样本 
不 平衡 因素 的 影响 , 研究 者 通常 选择 平衡 正确 率 (bal 
anced accuracy，bAcc) 作为 评价 算法 性 能 的 指标 。 


bAcc 为 真 阳 率 与 真 阴 率 的 平均 值 ， 真 阳 率 为 测试 集 
中 被 正确 识别 为 识 的 样本 数目 占 训 样 本 总 数 的 比例 ， 
真 明 率 为 测试 集中 被 正确 识别 为 非 台 的 样本 总 数 占 


非 靶 样本 总 数 的 比例 。 
2.3 算法 分 类 性 能 随 7 样 本 数目 的 变化 情 ; 


本 文 提出 TDSA 算 法 在 两 个 数据 集中 相 较 其 他 


基于 数据 迁移 的 分 类 策略 均 表 现 出 显著 性 能 优势 。 表 
1、 表 2 为 两 数据 集中 ZT 样本 数目 占 比 10% (507444 


TT 


本 


) 条 件 下 不 同 迁 移 学 习 方法 对 受 试 者 的 分 类 性 能 。 实 
验 使 用 单 尾 配对 样本 :检验 分 析 了 每 种 分 类 策略 与 
TDSA 算 法 之 间 bAcc 均 值 的 差异 ，p 值 经 FDR 方 法 校 
正 。 数 据 集 1 中 ，TDSA 算 法 在 所 有 受 试 者 中 均 取 得 
最 佳 分 类 性 能 ， 平均 bAcc 相 较 次 优 的 
EA+DSP+SKLDA 策 略 高 出 6.07% (p<0.01) ， 相 较 不 
使 用 数据 迁移 的 cali 策 略 高 出 7.88% (p<0.01) 。 数 据 


集 2 种 ，TDSA 算 法 分 类 表现 弱 于 数据 集 1， 但 
平 仍 高 于 其 他 策略 ， 且 差异 具有 统计 学 意义 。 


分 类 水 


表 1 数据 集 1 中 7 数据 占 比 10% 条 件 下 不 同 迁移 学 习 方法 


对 11 名 受 试 者 的 ErrP 分 类 性 能 对 比 


Table 1 Comparison ErrP classification performance of 


transfer learning methods among 11 subjects under the 


condition of 7; data accounting for 10% in dataset-1 


P 平衡 正确 率 (%) 
受 试 者 


cali DCT EA RA CA RPA TDSA 
1 72.66 77.84 72.08 69.86 68.91 72.58 81.26 

2 70.87 69.62 75.87 79.58 75.12 67.88 80.55 

3 86.92 81.66 88.65 89.46 87.48 89.25 91.53 

4 7545 71.22 77.13 73.24 71.69 70.58 82.88 

5 69.01 71.88 79.61 77.44 72.54 61.20 84.87 

6 86.50 76.03 89.55 83.50 83.65 84.60 93.15 

7 76.63 66.22 75.36 71.75 74.41 77.66 80.75 

8 83.13 79.47 86.63 85.69 82.88 82.32 89.86 

9 78.80 47.67 72.22 76.16 75.47 67.06 82.68 
10 77.38 71.85 77.77 72.79 72.15 63.64 84.95 
11 75.92 70.50 78.35 73.19 77.14 64.84 87.49 
均值 77.57 71.27 79.38 77.51 76.49 72.87 85.45 
标准 差 5.64 8.67 5.91 6.05 5.52 8.88 4.25 


P <0.01 <0.01 <0.01 <0.01 <0.01 <0.01 


表 2 数据 集 2 中 也 数据 占 比 10% 条 件 下 不 同 迁 移 学 习 方 法 


对 10 名 受 试 者 的 ErrP 分 类 性 能 对 比 


Table 2 Comparison ErrP classification performance of 


transfer learning methods among 10 subjects under the 


condition of 7; data accounting for 10% in dataset-2 


平衡 正确 率 (%) 


受 试 者 
cali DCT EA RA CA RPA TDSA 
1 68.94 75.88 77.29 5448 71.66 59.03 78.64 
2 62.77 75.38 78.23 5649 59.98 54.23 77.72 
3 53.94 55.41 60.32 51.17 59.46 59.19 60.12 
4 71.95 68.67 86.43 67.37 73.02 67.39 86.11 
5 72.08 7849 85.15 53.97 68.77 57.82 86.81 
6 50.87 53.62 55.87 53.00 55.97 53.31 58.1 
7 68.66 72.95 73.82 50.71 62.95 67.89 76.66 
8 66.5 71.54 78.77 71.80 71.88 68.34 80.18 
9 62.05 50.11 56.49 50.92 53.49 49.85 61.20 
10 61.01 60.81 68.58 66.02 63.44 69.94 68.43 
均值 63.88 66.29 72.10 57.59 64.06 60.70 73.40 
标准 差 6.85 9.86 10.7 7.39 6.62 6.84 10.14 
P <0.01 <0.01 0.018 <0.01 <0.01 <0.01 
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分 类 水 平 。 这 一 结果 说 明 ，TDSA 算 法 可 以 充分 利用 


图 3、 图 4 为 迁移 算法 性 能 随 T 中 样本 数量 的 变化 
误差 线 为 标准 差 。 结 果 表 明 ，TDSA 算 法 
在 所 有 样本 数量 条 件 下 相 较 其 他 算法 均 表现 出 最 佳 
性 能 。TDSA 算 法 通过 迁移 源 域 受 试 者 的 已 知 信息 ， 
仅 需 60 一 100 个 被 标记 的 目标 受 试 者 样本 训练 算法 ， 
即 可 接近 cali 策 略 使 用 210 一 350 个 村 


本 训练 算法 时 的 


已 有 受 试 者 数据 减少 ErrP-BCI 系 统 的 校准 时 间 ,， 从 而 


显著 提高 ErrP-BCI 系 统 的 易 用 性 。 


此 外 ， 基 于 黎 曼 几何 框架 的 RA、RPA 算 法 处 理 
ErrP 数 据 迁 移 问 题 时 表现 不 佳 ， 该 现象 与 下 


FE Us 


RPA 处 理 P300 数 据 迁 移 问 题 时 效果 表现 劣 于 同类 算 


习 框 


95 


90 


平衡 正确 率 (%) 


5 
10% 20% 20% 40% 50% 60% 70% 


训练 集 样本 数目 


ZA 


法 的 结果 类 似 ; 该 结果 表明 , MAET 
架 需 要 做 出 调整 才能 适用 于 ErrP 数 据 迁 移 。 
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的 迁移 学 


—e— cai —*—- DCT ~ EA+DSP+SKLDA 一 人 一 TDSA 


—&— RA+MDRM —®— CA+TSclassifier 
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图 3 数据 集 1 中 算法 性 能 随即 大 小 数量 的 变化 


Fig.3 Algorithm performance in dataset-1 with different 


sizes of T; 
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图 4 数据 集 2 中 算法 性 能 随 7T/ 大 小 数量 的 变化 

Fig.4 Algorithm performance in dataset-2 with different 
sizes of T; 

共有 判别 子 成 分 对 齐 效果 

为 考察 共有 判别 子 成 分 对 齐 的 作用 效果 ， 在 使 

用 TDSA 进 行 迁 移 学 习 的 过 程 中 , 使 用 :分 布 随机 近邻 

ik A. Ct-distributed stochastic neighbor embedding ， 

L-SNE ) 算法 对 共有 判别 子 成 分 对 齐 前 数据 

Is" |n ElK], j E OR IECILN] 与 对 齐 后 数据 

15", |n €, K], j © {0,1}, E [1, Ny Jf 的 分 布 情况 进行 可 


2.4 


视 化 。 实 验 使 用 数据 集 1 中 9 号 受 试 者 作为 目标 受 试 者 
， 令 工 中 样本 数目 占 9 号 受 试 者 样本 总 数 10%， 以 其 


他 作为 源 受 试 者 展开 实验 ， 结 果 如 图 5 所 示 。 可 见 ， 
共有 判别 子 空间 对 齐 策略 可 以 有 效 提 高 对 类 别 和 非 
邯 类 别 之 间 的 分 布 差异 从 而 提升 ErrP 识 别 效果 。 


未 使 用 判别 子 空间 对 齐 策 略 


使 用 判别 子 空间 对 齐 策略 


100 


50 


50 


we 
图 5 共有 判别 子 成 分 对 齐 策略 对 数据 分 布 的 影响 
Fig.5 Effect of common discriminant subcomponent 


alignment strategy on data distribution 


25 算法 计算 成 本 对 比 
本 研究 实验 的 环境 为 : Intel (R) Core i9-12900K 
处 理 器 ，64G 内 存 ，64 位 Windows 11 系 统 ， 算 法 使 用 
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Python 3.10 实 现 。 各 迁移 学 习 策 略 的 计算 成 本 如 图 6 
所 示 ， 图 中 结果 为 T 中 样本 数目 占 目 标 受 试 者 样本 
总 数 10%〔50 个 样本 ) 条 件 下 ， 所 有 受 试 者 训练 时 间 
的 平均 值 ， 图 中 误差 线 为 标准 差 。 可 知 TSDA 算 法 计 
算 成 本 与 EA+DSP+SKLDA 近 似 ， 完 成 迁移 学 习 与 分 
类 器 构建 耗 时 约 为 8.38 s， 显 著 低 于 EA、RA、CA 等 
基于 非 欧 距离 度量 的 迁移 学 习 方 法 , 具有 良好 的 计算 
经 济 性 。 


训练 用 时 (S) 


DCT EA RA CA RPATSDA 
算法 


图 6 各 迁移 学 习 策 略 计 算 用 时 


Fig.6 Computational time of different transfer learning 
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3 结 论 

针对 当前 ErrP-BCI 校 准时 间 长 的 问题 ， 本 文 提出 
一 种 基于 数据 对 齐 策略 的 TDSA 算 法 。 该 算法 通过 共 
有 判别 成 分 空间 滤波 器 提取 目标 受 试 者 和 源 受 试 入 
所 共有 的 类 间 差 异 特征 , 并 进一步 在 子 空间 中 实现 源 
受 试 者 与 目标 受 试 者 的 时 域 特征 对 齐 。 实 验 结果 表明 
，TDSA 算 法 利用 已 有 源 受 试 者 数据 ， 仅 需 采集 60 
一 100 个 目标 受 试 者 数据 作为 训练 样本 ， 即 可 接近 传 
统 分 类 策略 使 用 210 一 350 个 样本 进行 训练 的 分 类 水 
平 ， 使 得 ErrP-BCI 校 准时 间 显 著 降 低 。 研 究 同时 在 2 
个 公开 数据 集 上 使 用 交叉 验证 方法 ， 对 比 TDSA 与 
他 先进 迁 执 迁移 学 习 策 略 之 间 的 ErrP 分 类 效果 。 结果 
KH, 数据 集 1 中 仅 有 50 个 训练 样本 的 条 件 下 , TDSA 
相 较 次 优 的 EA+DSP+SKLDA 策 略 高 出 6.07%， 相 较 
不 使 用 数据 迁移 的 传统 策略 高 出 7.88%。 因 此 ， 本 文 
提出 的 TDSA 算 法 可 有 效 降低 现 有 ErrP-BCI 系 统 校准 


所 需 的 EEG 样 本 数目 ， 为 解决 ERP 数 据 迁 移 问题 提供 
了 新 的 思路 。 
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